Сайт Информационных Технологий

СПОСОБЫ ЗАДАНИЯ РАССТОЯНИЙ НА СТРУКТУРИРОВАННЫХ ОБЪЕКТАХ, ОПРЕДЕЛЕННЫХ ЧАСТИЧНО ЗАДАННЫМИ

ФОРМУЛАМИ

А.А. Викентьев, Л.Н. Коренева

Институт математики СО РАН, Новосибирск, Россия

Abstract — In this work the structural objects are considered. This objects can be determined as partly given formulas. By making use of the methods of mathematical logic and model theory we suggest the way of determining the distance between the structural objects and the quantitative measure of information of objects. In work we study the properties of entered distances.

Введение

В распознавании образов и создании экспертных систем большую роль играют структурированные объекты и информация о них, полученная от экспертов. Эта информация может быть представлена в виде списка логических высказываний экспертов, записанных в виде формул.

Высказывания различаются по количеству содержащейся в них информативности, и, следовательно, возникают задачи согласования высказываний.

При согласовании высказываний особую роль приобретает вопрос введения метрики на высказываниях экспертов и количественной меры информативности высказываний.

В работе рассматриваются частично заданные высказывания экспертов, предлагаются способы задания расстояний и меры информативности на структурированных объектах. Изучаются свойства введенных расстояний.

 

  1. Введение расстояний и его свойства
  2. Зафиксируем язык первого порядка , состоящий из конечного числа предикатных символов. Пусть - непустое множество (элементы которого суть наблюдаемые объекты) мощности .

    Имеется конечное число экспертов. Каждый эксперт дает свою интерпретацию символам языка в соответствующие частичные отношения (предикаты) на множестве . Это позволяет говорить о моделях.

    Обозначим через множество всех моделей языка , определенных на множестве экспертами. Предположим, что на формульных подмножествах множества задана вероятностная мера .

    Вместо частично заданного экспертом предиката будем рассматривать индуцированный предикат , который совпадает с на множестве точно определенных значений.

    Введем расстояние между высказываниями (предикатами) на множестве частично заданных моделей . Модели различаются интерпретациями.

    Определим расстояние между формульными подмножествами (предикатами) в каждой модели .

    Определение1. Расстоянием между предикатами и , частично определенными в модели , назовем величину

    Замечание. Если рассматриваемые предикаты имеют разную арность, т.е. эксперт не высказывается о значении некоторой характеристики, тогда полагаем, что эта характеристика является пустым множеством.

    Расстояние между предикатами на всем семействе моделей определим как среднее на множестве расстояний в моделях.

    Определение2. Расстоянием между предикатами и , частично определенными на множестве , назовем величину

    Далее, для простоты обозначений, знак будем опускать, поскольку это не вызовет недоразумений.

    Теперь рассмотрим способ определения расстояния между предложениями.

    Обозначим через множество моделей из , на которых истинно предложение , т.е. ? .

    Очевидно, существуют такие модели, на которых не тавтологичное предложение истинно, и такие, на которых оно ложно. Естественно измерять различие информации, содержащейся в предложениях, количеством моделей, на которых предложения принимают разные значения истинности.

    Определение3. Расстоянием между предложениями и назовем величину

    Рассмотрим еще один способ определения расстояния между формулами. Дополним язык первого порядка константами из множества . Для этого множества рассмотрим произвольные кортежи длины местности формул, равной .

    При подстановке кортежей в формулы, в предположении, что формулы имеют одинаковую местность (как этого добиться, было показано выше), формулы становятся предложениями.

    Определение4. Расстоянием между формулами и назовем величину

    .

    Доказана теорема, из которой следует, что предложенные расстояния действительно являются метриками. В теореме доказаны и некоторые дополнительные свойства введенных расстояний.

    Теорема1. Для любых формул , , справедливы для любого следующие свойства:

    1.

    2..

    3.Если и , то

    .

    4.

    5.

    6.

    7.

    8..

    9. .

     

  3. Мера информативности и ее свойства
  4. С точки зрения важности информации, сообщенной экспертом, естественно считать, что информативность высказывания тем выше, чем меньше моделей (или мера), на которых оно выполнимо, поэтому введем информативность следующим образом.

    Определение5. Пусть - предикат, отражающий знание эксперта, тогда мерой информативности предиката назовем величину

    , где 1 -- тождественно истинный предикат.

    Теорема2. Для любых формул ,

    1.

    2.

    3. .

    4.

    5.

    6.

    7.

    8. Если , то

    9. Если ,

    то

    10.

    11.

     

  5. Асимптотические свойства расстояний

Часто неизвестен точный размер области определения, известно только, что большое. Поэтому имеет смысл изучать асимптотическое поведение расстояния между высказываниями экспертов при устремлении к бесконечности. Зависимость расстояния от дальше будем обозначать через . По поводу асимптотического исследования в этом случае получены следующие результаты.

Теорема3. Если и высказывания экспертов, записанные как предложения языка первого порядка, состоящего только из предикатных символов, тогда

а) сходится к 0 или 1 при

б) Если одно из высказываний и отрицание другого принадлежат некоторой полной непротиворечивой теории (множеству предложений), то

в) Если оба этих высказывания либо их отрицания принадлежат некоторой полной непротиворечивой теории, то

г) Если вместо множества всех моделей рассматривать подмножество, содержащее по одному представителю каждого изоморфного типа моделей исходного множества, то асимптотическое поведение расстояния между высказываниями экспертов, не меняется.

 

  1. Расстояние между деревьями решений и мера информативности

Для представления логических решающих функций распознавания образов и экспертных систем используются деревья решений (структурированные объекты).

Пусть задан исходный набор переменных с областями значений и , -набор значений переменных для объекта . Пусть -дерево решений, разбивающее множество объектов на образов.

Из определения дерева решений [1] следует, что для любого ; для , и каждое дерево решений дает:

1) Разбиение множества на попарно непересекающиеся подмножества , где , ; , ; (набор переменных, по которому строится каждая ветвь дерева, может быть произвольным);

Замечание: если нескольким путям, ведущим от корня дерева к висячей вершине, соответствуют области соответственно, которые определяют один и тот же образ , то в разбиении .

2) Значения образов (классов) , .

3) Каждому пути от корня дерева к висячей вершине соответствует формула , где каждый предикат определяется заданием множества .

Замечание: если формулы определяют один и тот же образ , то вместо них рассматриваем формулу , которая будет определять образ .

4) Дереву соответствует набор формул .

Пусть -конечное множество деревьев решений, разбивающих множество объектов на образов. И пусть дереву соответствует набор формул , а дереву - .

Замечание: Формулы и определяют один и тот же образ со значением .

Тогда расстояние между деревьями решений определим следующим образом.

Определение6. Расстоянием между деревьями и назовем величину , где

Это расстояние также является метрикой и удовлетворяет всем утверждениям теоремы 1.

С точки зрения наилучшего разбиения множества будем считать, что информативность дерева решений тем выше, чем больше расстояние между подмножествами разбиения, поэтому введем информативность следующим образом.

Определение7. Пусть - дерево решений, тогда его мерой информативности назовем величину

Теорема4. Для любых деревьев решений и верны свойства:

1.

2. , (1- дерево решений с одним классом в случае ).

3., (имеет смысл только для двух классов).

4. Если = (совпадение деревьев в смысле разбиений и значений образов), то .

5. , (пересечение и объединение деревьев по подмножествам, определяющим один и тот же образ).

6. Если , то .

Работа проделана частично при поддержке гранта РФФИ № 980100673 и программы ‘’Интеграция’’.

Литература

  1. Лбов Г.С. Методы обработки разнотипных экспериментальных данных. Новосибирск: Наука, 1981, 158 с.
  2. Викентьев А.А., Коренева Л.Н. Расстояние на высказываниях экспертов.// Сборник научных статей Международной конференции ’’Компьютерный анализ данных и моделирование’’. Минск, 1998. С. 160-166.

Site of Information Technologies
Designed by  inftech@webservis.ru.